EVENTO
Um framework tolerante a falhas baseado no modelo de atores para solução numérica de equações diferenciais
Tipo de evento: Defesa de Tese de Doutorado
Ambientes massivamente paralelos e distribuídos abrem novos horizontes para todo tipo de aplicações, mas apresentam desafios para o desenvolvimento de software nesses ambientes. Muitas aplicações aproveitam o aumento da capacidade computacional fornecida por esses ambientes, no entanto, a disponibilidade de tantos processadores para trabalhar em uma única aplicação implica também na adoção de mecanismos de coordenação e distribuição de tarefas computacionais que sejam capazes de mitigar falhas na operação desses processadores. A fim de explorar todo o potencial desses ambientes na presença de falhas, esta tese tem o objetivo de investigar e propor um framework multi-linguagem para apoio ao desenvolvimento de simuladores numéricos tolerantes a falhas. Atributos como escalabilidade e tempo de desenvolvimento do software (time-to-market) levaram à adoção do modelo de atores no tratamento dos aspectos de distribuição de processos usualmente presentes nesses simuladores. Para a computação numérica, é considerado o uso do suporte dado pelas linguagens de programação usuais na área de simulação numérica, como Fortran, C e C++. Padrões de projeto foram empregados no framework com o objetivo de tornar a adaptação do framework a diferentes métodos numéricos limitada à definição de regras simples de transição de estados. Assim, desenvolvedores de simuladores não precisam tomar conhecimento do modelo de programação de atores, mas somente das interfaces providas no framework para a publicação e recuperação de resultados de primitivas de computação numérica derivadas desses métodos, bem como da causalidade entre essas primitivas. Para fins de avaliação do framework proposto, empregou-se o mesmo em dois diferentes métodos numéricos desenvolvidos no LNCC: a família de métodos MHM (Multiscale Hybrid-Mixed) e o método HO-FV-LTS (High Order Finite Volume with Local Time Stepping). Os experimentos realizados comprovaram que o framework tem a capacidade de se recompor de falhas e, além disso, mostraram a viabilidade e eficiência de seu uso sob condições específicas em ambientes massivamente paralelos.Palavras-chave: simulação numérica; tolerância a falhas; modelo de atores.
Data Início: 15/03/2019 Hora: 10:00 Data Fim: 15/03/2019 Hora: 14:00
Local: LNCC - Laboratório Nacional de Computação Ciêntifica - Auditorio A
Aluno: Franklin Zillmer - LNCC - LNCC
Orientador: Antônio Tadeu Azevedo Gomes - Laboratório Nacional de Computação Científica - LNCC Frédéric Gerard Christian Valentin - Laboratório Nacional de Computação Científica - LNCC
Participante Banca Examinadora: Antônio Tadeu Azevedo Gomes - Laboratório Nacional de Computação Científica - LNCC Cesar de Rose - PUC-RS - PUC-RS Francisco Brasileiro - Universidade Federal de Campina Grande - UFCG Pablo Javier Blanco - Laboratório Nacional de Computação Científica - LNCC
Suplente Banca Examinadora: Artur Ziviani - Laboratório Nacional de Computação Científica - LNCC Lucia Maria de Assunção Drummond - Universidade Federal Fluminense - UFF